首页> 外文OA文献 >A Comparative Study of Efficient Initialization Methods for the K-Means Clustering Algorithm
【2h】

A Comparative Study of Efficient Initialization Methods for the K-Means Clustering Algorithm

机译:K-means高效初始化方法的比较研究   聚类算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

K-means is undoubtedly the most widely used partitional clustering algorithm.Unfortunately, due to its gradient descent nature, this algorithm is highlysensitive to the initial placement of the cluster centers. Numerousinitialization methods have been proposed to address this problem. In thispaper, we first present an overview of these methods with an emphasis on theircomputational efficiency. We then compare eight commonly used linear timecomplexity initialization methods on a large and diverse collection of datasets using various performance criteria. Finally, we analyze the experimentalresults using non-parametric statistical tests and provide recommendations forpractitioners. We demonstrate that popular initialization methods often performpoorly and that there are in fact strong alternatives to these methods.
机译:K-means无疑是使用最广泛的分区聚类算法。不幸的是,由于其梯度下降特性,该算法对聚类中心的初始位置非常敏感。已经提出了许多初始化方法来解决这个问题。在本文中,我们首先对这些方法进行了概述,重点是它们的计算效率。然后,我们使用各种性能标准,在各种数据集上比较了八种常用的线性时间复杂度初始化方法。最后,我们使用非参数统计检验分析实验结果,并为从业者提供建议。我们证明了流行的初始化方法通常性能较差,并且实际上有很多替代方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号